Définition d'un agent conversationnel assistant d'applications internet à partir d'un corpus de requêtes
نویسندگان
چکیده
RÉSUMÉ. Les Agents Conversationnels Assistants sont une sous-classe des Agents Conversationnels Animés, dédiée à la Fonction d’Assistance pour les applications et services du grand public. Les nouvelles applications Internet sont un domaine particulièrement intéressant pour étudier les agents assistants pour le grand public. Nous avons donc développé un logiciel orienté Web, appelé le « toolkit DIVA », où la Fonction d’Assistance est une question clé et où la Langue Naturelle joue un rôle essentiel. C’est la raison pour laquelle le toolkit DIVA repose sur une chaîne de Traitement Automatique de la Langue Naturelle (TALN) qui est chargée de traiter des requêtes d’assistance. Dans ce contexte, les outils de TALN ainsi que les outils d’assistance devraient être simples et faciles à déployer pour chaque nouvelle application Web assistée par un agent DIVA. Notre proposition repose sur le recueil d’un corpus de requêtes d’assistance qui permet d’une part de circonscrire le domaine de langue concerné et d’autre part d’éliciter les principaux phénomènes linguistiques qui occurrent effectivement. Sur cette base, nous avons défini une architecture de chaîne de traitement qui a été implémentée dans le toolkit DIVA ; elle a ensuite été mise à l’épreuve sur plusieurs applications test. ABSTRACT. Assisting Conversational Agents are Embodied Conversational Agents dedicated to the Function of Assistance for applications and services to the general public. Assisting agents for the general public are more and more required on the Internet-based new applications. We have developed a web-based framework to experiment with assisting agents, called the DIVA toolkit, where the Function of Assistance is a key issue, and the Natural Language modality is a primary concern. This is why the DIVA toolkit is based on a Natural Language Processing chain (NLP-chain) handling the users’ textual help requests. In this context, both the NLP-chain tools and the assistance tools should be simple and easy to deploy for each new Web application assisted by the DIVA agents. Our proposition relies on the collection of a corpus of assisting requests which firstly enables us to circumscribe the domain of assistance and secondly makes it possible to exhibit the main occurring linguistic phenomena. On this basis, the architecture of a NLP-chain has been defined and implemented in the DIVA toolkit; then it has been put to test on several small applications. MOTS-CLÉS : Agents Conversationnels orientés Web, Corpus de requêtes d’assistance.
منابع مشابه
Processus d'acquisition d'un dictionnaire de sigles et de leurs définitions à partir d'un corpus
De nombreux domaines comme la biologie ou la médecine voient naître chaque jour de nouveaux termes et abréviations, notamment des sigles. Un sigle est un ensemble de lettres initiales servant d’abréviation, par exemple "RATP" peut être associé à la définition (aussi appelée expansion) "Régie Autonome des Transports Parisiens". Nos travaux ont consisté à développer un logiciel afin de faciliter ...
متن کاملDaFOE : an Ontology Building Platform From Texts or Thesauri?
La construction d'ontologies à partir de textes fait l'objet d'études depuis plusieurs années dans le domaine de l'ingénierie des ontologies (Terminae Aussenac-Gilles et al. (2000), Text2Onto Cimiano & Volker (2005)). Un cadre méthodologique en quatre étapes (constitution d'un corpus de documents, analyse linguistique du corpus, conceptualisation, opérationnalisation de l'ontologie) est commun ...
متن کاملUn système expert d'aide à la classification taxonomique de classes de descripteurs
To cite this version: Marc Caillet. Un système expert d'aidè a la classification taxonomique de classes de descrip-teurs. HAL is a multidisciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research center...
متن کاملAmélioration d'un corpus de requêtes à l'aide d'une méthode non-supervisée
RÉSUMÉ. Cet article présente une méthode d’amélioration d’un corpus de requêtes par regroupement des mots qui sont graphiquement similaires. L’approche utilisée est basée sur une distance d’édition normalisée et sur des propriétés statistiques distributionnelles; elle ne s’appuie sur aucune base de connaissances. Cette méthode a été développée pour résoudre un problème industriel: l’amélioratio...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Technique et Science Informatiques
دوره 29 شماره
صفحات -
تاریخ انتشار 2010